昨天在講 Named Entity Recognition(命名實體辨識)的時候,有講到「Hidden Markov Model (HMM)」,但是沒有特別介紹他是什麼。
今天就要來介紹 Hidden Markov Model (HMM)~~
簡單來說,HMM 是 從 Markov chain 延伸出來的機器學習模型
最大的區別在於:Markov chain 我們可以看到狀態的內容,但是 HMM 看不到
基本的運作原理:從一個初始狀態開始,然後沿著狀態一直走下去,累積機率,最後停在某個狀態上
它的特色很明顯:
雖然我們無法直接知道真實狀態,但有三個「線索」幫助我們推斷:
這邊簡單講解一下馬可夫鏈是在做什麼的~
未來的狀態只依賴於當前的狀態,與更久以前的歷史無關。
理解 HMM 的三個核心問題,就可以知道他到底在做什麼了。
O
及模型參數 λ = (A,B)
,得出此序列的機率 P(O|λ)
(likelihood)∑
O
及模型參數λ
,得出最有可能的隱藏狀態序列(hidden state sequence)O
,學習模型的參數 A
、B
並調整,使得前面 Evaluation/Likelihood 裡面的機率 P(O|λ)
越大越好